CSV文件拆分一列数据为两列

有需求把csv文件中某一列TERM的数据拆分成2列

df = pd.read_csv('/data/xxx/规则汇总.csv',encoding='GBK')
df.loc[df["TERM"].astype(str)=="0","TERM"]=":0"
df.loc[df["TERM"].astype(str)=="3","TERM"]=":3"
df.loc[df["TERM"].astype(str)=="4","TERM"]=":4"
df.loc[df["TERM"].isnull()==True,"TERM"]=":"
df.loc[df["TERM"].astype(str)=="总逾期次数0","TERM"]="总逾期次数:0"
df["TERM_A"],df["TERM_B"]=df["TERM"].str.replace(":",":").str.replace("xx分","xx分:").str.split(":",1).str
df.to_csv("/data/xxx/规则汇总2.csv",index=False,sep=',')

后来发现导出的csv文件中文是乱码,excel能够正确识别用gb2312、gbk、gb18030或utf_8 with BOM 编码的中文,所以测试了下,添加了参数 encoding=‘gbk’ 或者 encoding=‘utf-8-sig’

关于utf-8与utf_8_sig的区别:
UTF-8以字节为编码单元,它的字节顺序在所有系统中都是一様的,没有字节序的问题,也因此它实际上并不需要BOM(“ByteOrder Mark”)。但是UTF-8 with BOM即utf-8-sig需要提供BOM。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值